home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9610 / 000153_owner-urn-ietf _Thu Oct 31 15:56:36 1996.msg < prev   
Internet Message Format  |  1997-02-19  |  2KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id PAA19876 for urn-ietf-out; Thu, 31 Oct 1996 15:56:36 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id PAA19871 for <urn-ietf@services.bunyip.com>; Thu, 31 Oct 1996 15:56:34 -0500
  3. Received: from windrose.omaha.ne.us by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA28840  (mail destined for urn-ietf@services.bunyip.com); Thu, 31 Oct 96 15:56:31 -0500
  5. Message-Id: <9610312056.AA28840@mocha.bunyip.com>
  6. Received: by privateer.windrose.omaha.ne.us; Thu Oct 31 14:55 CST 1996
  7. From: "Ryan Moats" <jayhawk@ds.internic.net>
  8. To: "Gregory J. Woodhouse" <gjw@wnetc.com>,
  9.         "Martin J Duerst" <mduerst@ifi.unizh.ch>
  10. Cc: "urn-ietf@bunyip.com" <urn-ietf@bunyip.com>
  11. Date: Thu, 31 Oct 96 14:56:43 
  12. Priority: Normal
  13. X-Mailer: PMMail 1.52 For OS/2 UNREGISTERED SHAREWARE
  14. Mime-Version: 1.0
  15. Content-Type: text/plain; charset="us-ascii"
  16. Content-Transfer-Encoding: 7bit
  17. Subject: [URN] UTF-8/ASCII (was: New Syntax Draft)
  18. Sender: owner-urn-ietf@services.bunyip.com
  19. Precedence: bulk
  20. Reply-To: "Ryan Moats" <jayhawk@ds.internic.net>
  21. Errors-To: owner-urn-ietf@bunyip.com
  22.  
  23. On Thu, 31 Oct 1996 05:54:38 -0800 (PST), Gregory J. Woodhouse wrote:
  24.  
  25. >On Thu, 31 Oct 1996, Martin J Duerst wrote:
  26. >
  27. >> Gregory Woodhouse wrote:
  28. >> 
  29. >> This difference is always absolutely clear! A string that only contains
  30. >> bytes with the high bit '0' (7-bit bytes) is ASCII. As soon as a high
  31. >> bit is set to '1', it's not ASCII anymore. It may be UTF-8, or may not.
  32. >>
  33. >I understand this point, but I'm not talking about UTF-8 itself, but UTF-8
  34. >encoded into ASCII.
  35.  
  36. At the risk of being obvious, any UTF-8 encoded to ASCII (according to
  37. the syntax doc) is going to have a leading octet encoded as something
  38. in the %80-%FF range.  Anything in the %00-%7F range is an unsafe
  39. (based on one definition or another) ASCII character.
  40.  
  41. However, I think this is somewhat moot (I think this argues for removing
  42. the UTF-8 decoding requirement.)
  43.  
  44. Ryan
  45.